\section{矩阵概念的一些背景}

\begin{frame}{矩阵概念的一些背景}

在线性方程组的讨论中我们看到， 线性方程组的一些重要性质反映在它的系数矩阵和增广矩阵的性质上，并且解方程组的过程也表现为变换这些矩阵的过程。 除线性方程组之外， 还有大量的各种各样的问题也都提出矩阵的概念， 并且这些问题的研究常常反映为有关矩阵的某些方面的研究， 甚至于有些性质完全不同的、表面上完全没有联系的问题，归结成矩阵问题以后却是相同的。 这就使矩阵成为数学中一个极其重要的应用广泛的概念， 因而也就使矩阵成为代数特别是线性代数的一个主要研究对象。这一章的目的是引入矩阵的运算，并讨论它们的一些基本性质。

\pause
为了使读者对矩阵的概念以及下面要讨论的问题的背景有些了解，我们来介绍一些提出矩阵概念的问题。 当然， 由于篇幅和目前知识的限制， 介绍的方面有很大局限性。
\end{frame}

\begin{frame}

  \begin{example}[坐标变换]
    \label{1BC}
在解析几何中考虑坐标变换时， 如果只考虑坐标系的转轴 (逆时针方向转轴), 那么平面直角坐标变换的公式为
\[\tag{1}
  \begin{cases}
        x=x^{\prime} \cos \theta-y^{\prime} \sin \theta,  \\
        y=x^{\prime} \sin \theta+y^{\prime} \cos \theta
  \end{cases}
\]
其中 $\theta$ 为 $x$ 轴与 $x^{\prime}$ 轴的夹角。
\pause
显然， 新旧坐标之间的关系， 完全可以通过公式中系数所排成的 $2 \times 2$ 矩阵
\[ \tag{2}
  \begin{pmatrix}
        \cos \theta & -\sin \theta \\
        \sin \theta & \cos \theta
  \end{pmatrix}
\]
表示出来。通常，矩阵 (2) 称为坐标变换 (1) 的矩阵。 
\pause
在空间的情形，保持原点不动的仿射坐标系的变换有公式
\[
  \begin{cases}
        x=a_{11} x^{\prime}+a_{12} y^{\prime}+a_{13} z^{\prime}  \tag{3}\\
        y=a_{21} x^{\prime}+a_{22} y^{\prime}+a_{23} z^{\prime} \\
      z=a_{31} x^{\prime}+a_{32} y^{\prime}+a_{33} z^{\prime}
\end{cases}
\]
同样，矩阵
\[
  \begin{pmatrix}
        a_{11} & a_{12} & a_{13}  \tag{4}\\
        a_{21} & a_{22} & a_{23} \\
      a_{31} & a_{32} & a_{33}
\end{pmatrix}
\]
就称为坐标变换 (3) 的矩阵。
\end{example}
\end{frame}

\begin{frame}
  \begin{example}[二次曲线]
    二次曲线 (conics) 的一般方程为
\begin{equation*}
a x^{2}+2 b x y+c y^{2}+2 d x+2 e y+f=0 . \tag{5}
\end{equation*}
(5) 的左端可以用表
\begin{table}
\centering
\begin{tabular}{C||C|C|C}
 & x & y & 1 \\
   \hline\hline
    x & a & b & d \\
    \hline
   y & b & c & e \\
   \hline
  1 & d & e & f \\
 \end{tabular}
\end{table}
来表示，其中每一个数就是它所在的行和列所对应的 $x, y$ 或 $1$ 的乘积的系数，
而 (5) 的左端就是按这样的约定所形成的项的和。 
换句话说， 只要规定了 $x, y, 1$ 的次序， 二次方程 (5) 的左端就可以简单地用矩阵
  \[\tag{6}
   \begin{pmatrix}
a & b & d  \\
b & c & e \\
d & e & f
\end{pmatrix}
\]
来表示。 通常， (6) 称为二次曲线 (5) 的矩阵。 以后我们会看到，这种表示法不只是形式的。 事实上，矩阵 (6) 的行列式就是解析几何中二次曲线的不变量 $I_{3}$, 这表明了矩阵 (6)的性质确实反映了它所表示的二次曲线的性质。
       \end{example}
\end{frame}


 \begin{frame}
   \begin{example}[国民经济]
      在讨论国民经济的数学问题中也常常用到矩阵。 例如， 假设在某一地区， 某一种物资， 比如说煤， 有 $s$ 个产地 $A_{1}, A_{2}, \cdots, A_{s}$ 和 $n$ 个销地 $B_{1}, B_{2}, \cdots, B_{n}$, 那么一个调运方案就可用一个矩阵
     \[
        \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1 n} \\
a_{21} & a_{22} & \cdots & a_{2 n} \\
\vdots & \vdots & & \vdots \\
a_{s 1} & a_{s 2} & \cdots & a_{s n}
\end{pmatrix}
\]
来表示，其中 $a_{i j}$ 表示由产地 $A_{i}$ 运到销地 $B_{j}$ 的数量。
\end{example}

\pause
\begin{example}
$n$ 维向量也可以看成矩阵的特殊情形。 $n$ 维行向量就是 $1 \times n$ 矩阵， $n$ 维列向量就是 $n \times 1$ 矩阵。
\end{example}

 \end{frame}

 \begin{frame}
 以后我们用大写的拉丁字母 $A, B, \cdots$, 或者
  \[
   \left(a_{i j}\right),\left(b_{i j}\right), \cdots
  \]
  来代表矩阵。

  \pause
  当我们用$(a_{ij})$这种形式来写矩阵时我们习惯上指的是该矩阵的第 $i$行第$j$列元素为$a_{ij}$
  （注意我们习惯上用第一个指标$i$作为行指标，第二个指标$j$作为列指标）。
  第 $i$行第$j$列元素也称为\emph{$(i,j)$元素}。
  %\pause
  %另外，有些习惯用$A_{ij}$表示矩阵$A$的$(i,j)$元素；
  %我们没有这样做以避免记号的重复（当然我们总是可以从上下文来判断一个记号指什么），
  %因为我们用$A_{ij}$表示方阵中元素的代数余子式。

  \pause
  有时候， 为了指明所讨论的矩阵的行数和列数， 可以把 $s \times n$ 矩阵写成 $ A_{s \times n},  B_{s \times n}, \cdots$,或者
\[
\left(a_{i j}\right)_{s \times n}, \quad\left(b_{i j}\right)_{s \times n}, \quad\cdots .
\]
(注意矩阵的符号与行列式的符号的区别。)

\pause
在矩阵中忽略（尤其是成片的）$0$不写而留下空白是我们的惯例（也有习惯是在成片的某个好看的位置上留下一个$0$表示忽略的是$0$）。
例如：
\[
    \begin{pmatrix}
        1& 2\\
        & 3
    \end{pmatrix}=\begin{pmatrix}
        1& 2\\
        0 & 3
    \end{pmatrix},\quad 
    \begin{pmatrix}
        1 \\ &  2 \\ && 3
    \end{pmatrix} = \begin{pmatrix}
        1  & & 0\\ &  2 \\ 0 && 3
    \end{pmatrix} = \begin{pmatrix}
        1  & 0 & 0 \\ 0 &  2 & 0 \\ 0 & 0 & 3
    \end{pmatrix}.
\]


\pause
设 $ A=\left(a_{i j}\right)_{m \times n},  B=\left(b_{i j}\right)_{i \times k}$, 
如果 $m=l, n=k$, 且 $a_{i j}=b_{i j}$, 对 $i=1,2, \cdots, m ; j=1,2 \cdots, n$
都成立， 我们就说 $ A= B$. 即只有完全一样的矩阵才叫做\emph{相等}：同型且每个位置元素相等。

\end{frame}


